Hadoop部署常用的小脚本

2014-03-18 00:00来源：中国存储网

导读：最近抛弃非ssh连接的Hadoop集群部署方式了，还是回到了用ssh key 验证的方式上了。这里面就有些麻烦，每台机器都要上传公钥。恰恰我又是个很懒的人，所以写几个小脚本完成，只要在一台机器上面就可以做公钥的分发了。首先是生成ssh key脚本：ss

最近抛弃非ssh连接的Hadoop集群部署方式了，还是回到了用ssh key 验证的方式上了。这里面就有些麻烦，每台机器都要上传公钥。恰恰我又是个很懒的人，所以写几个小脚本完成，只要在一台机器上面就可以做公钥的分发了。

首先是生成ssh key脚本：

Hadoop部署常用的小脚本

ssh-keygen一般来说需要输入passphrase，但是一般都是三个回车过去了，我懒的输入，加上-P ''就不用了。

然后是添加公钥到从节点的脚本：

Hadoop部署常用的小脚本

然后是第三个脚本读取主机列表然后把/etc/hosts复制到所有主机上：

Hadoop部署常用的小脚本

继续阅读

中国存储网声明：此文观点不代表本站立场，如有版权疑问请联系我们。

相关阅读

深入Nutch index源代码解析(一)

Nutch集成slor的索引方法介绍? ?* 建立索引? ?* @param solrUrl solr的web地址? ?* @param crawlDb 爬取DB的存放路径：\crawl\crawldb

hadoop来了，你准备好了吗

我们想了个办法：把海量数据分成小块，让一台机器处理一小块数据，所有的机器同时工作。最后把结果汇总起来。这就是“并行计算”。hadoop中的MapReduce就是专门用来做分布式计算的并行处理框架。hadoop就是用来解决大数据的存储和计算的。

Hadoop教程（一）如何使用Hadoop分析数据

以Hadoop Tutorial为主体带大家走一遍如何使用Hadoop分析数据!MapReduce框架由一个Jobracker（通常简称JT）和数个TaskTracker（TT）组成（在cdh4中如果使用了Jobtracker HA特性，则会有2个Jobtracer，其中只有一个为active，另一个作为standby处于inactive状态）。JobTr